home *** CD-ROM | disk | FTP | other *** search
/ Collection of Internet / Collection of Internet.iso / infosrvr / dev / www_talk.930 / 001165_mvanheyn@cs.indiana.edu _Thu May 20 20:00:47 1993.msg < prev    next >
Internet Message Format  |  1994-01-24  |  4KB

  1. Return-Path: <mvanheyn@cs.indiana.edu>
  2. Received: from dxmint.cern.ch by  nxoc01.cern.ch  (NeXT-1.0 (From Sendmail 5.52)/NeXT-2.0)
  3.     id AA23269; Thu, 20 May 93 20:00:47 MET DST
  4. Received: from moose.cs.indiana.edu by dxmint.cern.ch (5.65/DEC-Ultrix/4.3)
  5.     id AA10863; Thu, 20 May 1993 20:21:58 +0200
  6. Received: from localhost by moose.cs.indiana.edu
  7.     (5.65c/9.4jsm) id AA00456; Thu, 20 May 1993 13:21:53 -0500
  8. From: Marc VanHeyningen <mvanheyn@cs.indiana.edu>
  9. To: feednews@news.cs.indiana.edu, www-talk@nxoc01.cern.ch
  10. Newsgroups: comp.infosystems.www,cs.techrpt
  11. Subject: New service: The Unified CS TR Index
  12. Distribution: world
  13. Organization: Computer Science Dept, Indiana University
  14. Date: Thu, 20 May 1993 13:21:53 -0500
  15. Message-Id: <454.737922113@moose.cs.indiana.edu>
  16. Sender: mvanheyn@cs.indiana.edu
  17.  
  18. Announcing the availability of an experimental new service within the
  19. World Wide Web (WWW), the Unified Computer Science Technical Report
  20. Index.
  21.  
  22. WHAT IT IS
  23.  
  24. It's pretty simple, really.  A daemon runs and pulls index files from
  25. many various FTP sites which archive tech reports (and similar
  26. material.)  At present, 39 FTP sites are included in the index, with
  27. over 1,400 reports included; both of these numbers are growing rather
  28. rapidly.  This information is then converted into entries for each
  29. tech report with hypertext anchors to the TR itself, producing a
  30. really big file.  This file is then searchable for keywords by a
  31. Simple Index Keyword Search (SIKS).  I believe it represents a
  32. potentially nicer general interface to this informational resources
  33. than existing methods (e.g. WAIS pointers to ftp sites).  It certainly
  34. is not the ultimate information browsing tool, but I hope it may push
  35. the migration towards such a little.
  36.  
  37. Note that this index only maintains pointers to papers that are
  38. available online by a simple mouse click within XMosaic; following a
  39. link will not entail walking to your local library or sending somebody
  40. a check.  I do not know of any other indexing system for CS papers
  41. which is this large and which easily allows direct network access to
  42. the documents themselves.
  43.  
  44. HOW TO USE IT
  45.  
  46. The URL is:
  47.  
  48.     http://cs.indiana.edu/cstr/search
  49.  
  50. LIMITATIONS
  51.  
  52. This is still highly experimental, but I wanted to mention its
  53. existence to the world so people can start to play around with it.
  54.  
  55. I'm sure there are some sites that archive TRs and the like that
  56. aren't included in the TR listings I got my hands on.  I'm not even
  57. done looking through the listings I have yet, so please don't bombard
  58. me with random names of archive sites not yet indexed just now unless
  59. you are the maintainer of one.
  60.  
  61. There are a lot of different archive sites, and thus there are a lot
  62. of different file formats for the indexes.  Some sites don't have an
  63. index at all.  Some sites have file structures that are not easy to
  64. grok.  The daemon I have written understands several different types
  65. of indexing, but does so in a rather crude way; thus, the results are
  66. typically functional but may not always look pretty.  If you don't
  67. like this, then you'll have to go out and persuade every site that
  68. archives TRs to agree on a standardized index file format.  Good luck;
  69. should take about 10 years. :-) If you would just like one specific
  70. site (say, yours) to look a little nicer, write some code in perl to
  71. do so and send it to me and I'll see what I can do.
  72.  
  73. Obviously, if an FTP site happens to be down when the index is made,
  74. its stuff won't be in there.  Other errors (e.g. typos in index files)
  75. can cause problems, but I can't really fix them.  Since the index file
  76. is so large, obviously I don't check all (or even very many) of the
  77. entries in it.
  78.  
  79. There are some sites with rather non-helpful filenames.  For example,
  80. the Xmosaic browser will automatically pop up a PostScript previewer
  81. if the filename ends with .ps (or .ps.Z or the like); however, some
  82. sites have PostScript files without that name.  Not much I can do
  83. about that.
  84.  
  85. Anyway, give it a try.  Feel free to send constructive criticisms,
  86. praise, or lavish gifts.
  87.  
  88. - Marc
  89. --
  90. Marc VanHeyningen   mvanheyn@cs.indiana.edu   MIME & RIPEM accepted
  91.  
  92. I'm married, I program computers, and I'm a grad student.  If that
  93. doesn't give me permission to look like a slob, I don't know what does.